Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)

Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)

作者: Tom White 林峰正 王耀聰 辜文元 施赬陽 周天穎 譯
出版社: 歐萊禮
出版在: 2016-09-14
ISBN-13: 9789864761364
ISBN-10: 9864761366




內容描述


準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop 2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro 的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。


目錄大綱


第一部分 Hadoop 基礎
chapter 1|遇見 Hadoop
chapter 2|MapReduce
chapter 3|Hadoop 分散式檔案系統
chapter 4|YARN
chapter 5|Hadoop 的 I/O
第二部分 MapReduce
chapter 6|開發 MapReduce 程式
chapter 7|MapReduce 如何運作
chapter 8|MapReduce 的類型與格式
chapter 9|MapReduce 的特性
第三部分 Hadoop 操作
chapter 10|建立一個 Hadoop 叢集
chapter 11|Hadoop 的管理
第四部分 相關專案
chapter 12|Avro
chapter 13|Parquet
chapter 14|Flume
chapter 15|Sqoop
chapter 16|Pig
chapter 17|Hive
chapter 18|Crunch
chapter 19|Spark
chapter 20|HBase
chapter 21|ZooKeeper
第五部分 案例研究
chapter 22|Cerner 的可聚集資料
chapter 23|生物資料科學:用軟體拯救生命
chapter 24|Cascading
appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
appendix D|舊版及新版的 Java MapReduce API
index




相關書籍

Hadoop Operations (Paperback)

作者 Eric Sammer

2016-09-14

Apache Kylin 大數據入門 (舊名: 集華人智慧之大成:Apache Kylin 用中文處理大數據)

作者 蔣守壯

2016-09-14

JavaScript and Ajax Wrox Box, 2/e: Professional JavaScript for Web Developers, Professional Ajax, Pro Web 2.0, Pro Rich Internet Applications

作者 Nicholas C. Zakas Jeremy McPeak Joe Fawcett Eric van der Vlist Danny Ayers Erik Bruchez Alessandro Vernet Dana Moore Raymond Budd Edward Benson

2016-09-14